你敢信?仅差2%!GPT-5电脑操作追平人类?
他们的Agent S3在CUA基准测评OSWorld里拿了69.9%的成绩,离人类72%的操作水平就差2个多点。
他们的Agent S3在CUA基准测评OSWorld里拿了69.9%的成绩,离人类72%的操作水平就差2个多点。
想象一下,你需要订个票、填写个表格,过去你可能得亲自敲键盘点鼠标,但现在有了智能体,它直接就能在你的电脑上替你操作,让你省下时间,去做一些更有意义的事情。
Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任务。